41 research outputs found

    Categorización automática de documentos

    Get PDF
    La clasificación de documentos de texto es una aplicación de la minería de textos que pretende extraer información de texto no estructurado. Su interés se justifica porque se estima que entre el 80% y el 90% de los datos de las organizaciones son no estructurados. Por otro lado, la búsqueda semántica permite al usuario especificar en una consulta no solamente términos que deben aparecer en el documento, sino conceptos y relaciones, que pueden detectarse mediante el análisis de texto. El objetivo de este trabajo es implementar un buscador semántico que aproveche el resultado de algoritmos de aprendizaje automático supervisado y semi-supervisado para la categorización o clasificación de documentos. El dominio de aplicación es un corpus de más de 8000 documentos que contienen nueve años de resoluciones rectorales de la Universidad Católica de Salta en distintos formatos.Sociedad Argentina de Informática e Investigación Operativ

    Aprendizaje automático aplicado a la pandemia del virus Covid-19 en Argentina

    Get PDF
    Este proyecto se desarrolló con el interés de analizar los casos registrados sobre Covid-19 en nuestro país, publicados por fuentes oficiales. Se experimentó con redes neuronales con el fin de predecir casos positivos de la enfermedad, y para encontrar similitudes entre algunos distritos de nuestro país se plantearon relaciones difusas.Eje: Agentes y sistemas inteligentes.Red de Universidades con Carreras en Informátic

    Minería de opiniones: análisis de sentimientos en una red social

    Get PDF
    El Grupo de Análisis de Datos de la Facultad de Ingeniería y del Instituto de Estudios Interdisciplinares de Ingeniería (IESIING) de la Universidad Católica de Salta, trabaja en proyectos de investigación relacionados a técnicas y aplicaciones de minería de datos y minería de textos. Entre las áreas investigadas se incluyen la categorización de documentos de texto, búsqueda semántica, extracción de entidades con nombre, generación de resúmenes y búsqueda automática de respuestas. Con el proyecto actual se añade un nuevo aspecto en la línea de investigación: el análisis de sentimientos también llamado minería de opiniones. En el tratamiento de opiniones, muchas investigaciones se centraron en el reconocimiento de polaridad en textos. Sin embargo, pocas realizaron una clasificación más exhaustiva y, mucho menos, en lenguaje español. El objetivo del proyecto es clasificar textos cortos (opiniones) en seis sentimientos: miedo, ira, asco, sorpresa, tristeza y felicidad. El proyecto se encuentra en desarrollo. En la primera etapa se recopilaron mensajes de la red social Twitter, muchos de los cuales formarán el corpus de análisis. En la etapa actual se están evaluando diversos enfoques para clasificación y detección de sentimientos en los mismos.Eje: Agentes y Sistemas Inteligentes.Red de Universidades con Carreras en Informátic

    Búsqueda de respuestas como aplicación del problema de extracción de relaciones

    Get PDF
    El volumen de información no estructurada en forma de documentos de texto de diversos orígenes es cada vez mayor. Para poder acceder a ella y obtener conocimiento que pueda ser aplicado a una diversidad de tareas, primero hay que “estructurar” esa información. La extracción de la estructura relacional entre entidades, en forma de tripletas basadas en un verbo, puede ser aplicada al problema de búsqueda de respuestas. Este trabajo ha hecho uso de técnicas eficientes de análisis superficial de texto y el sistema construido tiene una precisión y recall comparable a otros sistemas del estado del arte. Las tripletas extraídas forman la base de conocimientos sobre la que se hacen consultas para obtener respuestas a preguntas en lenguaje natural. Los resultados de este sistema de búsqueda de respuestas sobre un banco de preguntas a un corpus de 2052 documentos sobre Salta obtenidos de la web demuestran la validez de este enfoque

    Extracción de relaciones para la búsqueda automática de respuestas

    Get PDF
    El presente trabajo explora el problema de la búsqueda automática de respuestas en grandes cantidades de texto como una aplicación del problema de extracción de relaciones. Las relaciones extraídas, en forma de tripletas basadas en un verbo, describen relaciones semánticas entre los objetos que aparecen en el texto y facilitan su comprensión. Las tripletas extraídas forman la base de conocimientos sobre la que se hacen consultas para obtener respuestas a preguntas en lenguaje natural. El enfoque del trabajo ha hecho uso de técnicas eficientes de análisis superficial del texto y el sistema construido tiene una precisión y recall comparable a otros sistemas del estado del arte. El sistema de búsqueda de respuestas se evaluó sobre un banco de preguntas a un corpus de 2052 documentos sobre Salta obtenidos de la web.Sociedad Argentina de Informática e Investigación Operativa (SADIO

    Diseño de un sistema de búsqueda de respuestas para diversos tipos de preguntas

    Get PDF
    Los sistemas de búsquedas de respuestas tienen como objetivo responder de manera automática a las preguntas de un usuario expresadas en lenguaje natural. Se trata de una aplicación muy relevante de las técnicas de minería de textos, de interés creciente dada la gran cantidad de información no estructurada disponible en todo tipo de organizaciones. Este trabajo describe la arquitectura de un sistema que responde a preguntas de usuarios cuyas respuestas están en un corpus de más de ocho mil documentos que contienen resoluciones académicas y administrativas de una universidad. El sistema comienza clasificando las preguntas según el tipo de respuesta requerida, las analiza y transforma en consultas a un motor de búsqueda semántica que devuelve fragmentos del corpus de documentos que pueden contener la respuesta ordenados según su relevancia. Finalmente el sistema extrae las respuestas de dichos fragmentos y las presenta al usuario en su contexto textual. Este trabajo se centra especialmente en la descripción de las fases de clasificación de la pregunta y construcción de la consulta.Sociedad Argentina de Informática e Investigación Operativa (SADIO

    Aplicación de técnicas avanzadas de aprendizaje automático para identificar emociones en textos

    Get PDF
    En este proyecto se pretende aprender a clasificar textos cortos (opiniones) generados en la red social Twitter según el sentimiento que expresan, aplicando técnicas avanzadas de aprendizaje automático como redes neuronales. El proyecto se encuentra en desarrollo. En la primera etapa se exploró en la clasificación de textos usando una red neuronal LSTM y en la etapa actual, se está analizando algunas formas de representar los textos para crear un corpus de palabras embebidas que serán utilizadas en otros experimentos.Eje: Agentes y sistemas inteligentes.Red de Universidades con Carreras en Informátic

    Minería de opiniones: análisis de sentimientos en una red social

    Get PDF
    El Grupo de Análisis de Datos de la Facultad de Ingeniería y del Instituto de Estudios Interdisciplinares de Ingeniería (IESIING) de la Universidad Católica de Salta, trabaja en proyectos de investigación relacionados a técnicas y aplicaciones de minería de datos y minería de textos. Entre las áreas investigadas se incluyen la categorización de documentos de texto, búsqueda semántica, extracción de entidades con nombre, generación de resúmenes y búsqueda automática de respuestas. Con el proyecto actual se añade un nuevo aspecto en la línea de investigación: el análisis de sentimientos también llamado minería de opiniones. En el tratamiento de opiniones, muchas investigaciones se centraron en el reconocimiento de polaridad en textos. Sin embargo, pocas realizaron una clasificación más exhaustiva y, mucho menos, en lenguaje español. El objetivo del proyecto es clasificar textos cortos (opiniones) en seis sentimientos: miedo, ira, asco, sorpresa, tristeza y felicidad. El proyecto se encuentra en desarrollo. En la primera etapa se recopilaron mensajes de la red social Twitter, muchos de los cuales formarán el corpus de análisis. En la etapa actual se están evaluando diversos enfoques para clasificación y detección de sentimientos en los mismos.Eje: Agentes y Sistemas Inteligentes.Red de Universidades con Carreras en Informátic

    Minería de opiniones: análisis de sentimientos en una red social

    Get PDF
    El Grupo de Análisis de Datos de la Facultad de Ingeniería y del Instituto de Estudios Interdisciplinares de Ingeniería (IESIING) de la Universidad Católica de Salta, trabaja en proyectos de investigación relacionados a técnicas y aplicaciones de minería de datos y minería de textos. Entre las áreas investigadas se incluyen la categorización de documentos de texto, búsqueda semántica, extracción de entidades con nombre, generación de resúmenes y búsqueda automática de respuestas. Con el proyecto actual se añade un nuevo aspecto en la línea de investigación: el análisis de sentimientos también llamado minería de opiniones. En el tratamiento de opiniones, muchas investigaciones se centraron en el reconocimiento de polaridad en textos. Sin embargo, pocas realizaron una clasificación más exhaustiva y, mucho menos, en lenguaje español. El objetivo del proyecto es clasificar textos cortos (opiniones) en seis sentimientos: miedo, ira, asco, sorpresa, tristeza y felicidad. El proyecto se encuentra en desarrollo. En la primera etapa se recopilaron mensajes de la red social Twitter, muchos de los cuales formarán el corpus de análisis. En la etapa actual se están evaluando diversos enfoques para clasificación y detección de sentimientos en los mismos.Eje: Agentes y Sistemas Inteligentes.Red de Universidades con Carreras en Informátic

    Diseño de un sistema de búsqueda de respuestas para diversos tipos de preguntas

    Get PDF
    Los sistemas de búsquedas de respuestas tienen como objetivo responder de manera automática a las preguntas de un usuario expresadas en lenguaje natural. Se trata de una aplicación muy relevante de las técnicas de minería de textos, de interés creciente dada la gran cantidad de información no estructurada disponible en todo tipo de organizaciones. Este trabajo describe la arquitectura de un sistema que responde a preguntas de usuarios cuyas respuestas están en un corpus de más de ocho mil documentos que contienen resoluciones académicas y administrativas de una universidad. El sistema comienza clasificando las preguntas según el tipo de respuesta requerida, las analiza y transforma en consultas a un motor de búsqueda semántica que devuelve fragmentos del corpus de documentos que pueden contener la respuesta ordenados según su relevancia. Finalmente el sistema extrae las respuestas de dichos fragmentos y las presenta al usuario en su contexto textual. Este trabajo se centra especialmente en la descripción de las fases de clasificación de la pregunta y construcción de la consulta.Sociedad Argentina de Informática e Investigación Operativa (SADIO
    corecore